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strand, or of a deriv. of these. (A) has the activity of a 
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Pref., (A') contains 1 or more structural genes plus segments 
which cause secretion of expression products. Partic. (A') is part of 
an expression plasmid of the autonomous or integrating types. 

USE/ADVANTAGE - (A) is a very efficient promoter in yeasts, esp. 
Kluyveromyces and is used to express recombinant genes partic. 
simultaneous expression in 2 opposite orientations. These genes are 
esp. those of pharmaceutical or nutritional interest, esp. that for 
human serum albumin (HSA) ( 
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(S) Promoteur de levure et son utilisation. 

@ L'invention conceme des sequences d'ADN 
comprenant tout ou partie du promoteur du 
gdne PGK de K.lactis , ou d'un d6riv6 de celui-ci, 
et possSdant une activity de promoteur trans- 
aiptlonnel. Elle conceme ^gatement {'utilisa- 
tion de ces sequences pour Texpression de 
g^nes recombin^s. 
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La pr^sente invention concerne le domaine de la 
biologie mol^cutaire. Plus particuli^rement, elle 
concerne une nouvelle sequence d'ADN presentant 
une activity de promoteur transcriptionnel, des vec- 
teurs d*expression contenant cette sequence, et son 5 
utilisation pour la production de prot^ines, et par 
exempte de prot^ines h^t^rologues. L'invention 
concerne aussi les cellules recombin^es contenant 
cette sequence d'ADN. 

Les progr^s accomplis dans le domaine de la bio- io 
logie mol6culaire ont penmis de modifier des microor- 
ganismes pour leur faire produire des prot^ines h^t^ 
rologues. En particulier, de nombreuses etudes g§n6- 
tiques ont port6 sur la bact6rie E. coil. Toutefois, Tap- 
plication industrielle de ces nouveaux modes de pro- is 
duction est encore Hmit^e, en particulier par les pro- 
blames d'efficacit^ d'expression des g^nes dans ces 
microorganismes recombin^s. Aussi, dans le but 
d'augmenter les performances de ces syst^mes de 
production, des recherches ont 6t6 effectu^es afin 20 
d'isoler des promoteurs forts, penmettant d'obtenir 
des niveaux 6lev^s d'expression de prot^ines h^t^ro- 
logues. Chez E.coli , on peut citer en particulier les 
promoteurs des op6rons tryptophane et lactose. 

Plus r6cemment, chez la levure S. cerevisiae , 25 
des etudes ont port^ sur des promoteurs d^riv^s de 
g^nes impliquSs dans la glycolyse. On peut citer no- 
tamment les travaux sur te promoteur du g^ne de la 
3-phosphoglycerate kinase PGK (Dobson et al.. Nu- 
cleic Acid Res. 10, 1982, 2625 ; Hitzeman et al.. Nu- 30 
oleic Acid Research 1 982. 77d1), sur celui du g^ne de 
la glycerald6hyde-3-phosphate d6shydrog6nase 
GAPDH (Holland et al., J.BioI.Chem. 254, 1979. 
9839 ; Musti et al.. Gene 25, 1983, 133). sur celui du 
g^ne de I'alcool d6shydrog6nase 1 ADH1 (Ben- 35 
nentzen et a!., J.BioI.Chem. 257, 1982, 3018 ; Denis 
et al., J.BioI.Chem. 25. 1983, 1165), ou sur celui du 
g6ne de I'enolase 1 EN01 (Uemura et al.. Gene 45. 
1986, 65). 

R^cemment. des outils g^n^tiques ont ^t^ d^ve- 40 
lopp6s afin de se servir de la levure Kluyveromyces 
comme cellule h6te pour la production de prot^ines 
recomb in antes. La mise en Evidence d'un plasmide 
de type 2-micron originaire de K-drosophilarum (plas- 
mide pKD1 - BP 241 435) a permis d'6tablir un syst6- 4S 
me hote/vecteur tr^s efncace pour la production de 
prot6ines recombinantes (EP 361 991). Cependant, 
les promoteurs utilises dans ce syst§me n'ont jamais 
6t6 optimises. En particulier, il s'agit essentiellement 
de promoteurs h^t^rologues, c'est-^-dire provenant so 
d'autres microorganismes, tel que notamment S. cere- 
visiae . Cette situation peut engendrer diff^rents in- 
convenients, et notamment limiter ractivit6 du promo- 
teur d cause de I'absence de certains Elements de la 
machinerie transcriptionnelle (par exemple de trans- 55 
activateurs), presenter une certainee toxicity pour la 
cellule hdte due d une at>sence de regulation, ou af- 
fecter la stability du vecteur. 



Dans ces conditions, le manque de promoteurs 
homologues forts chez Kluyveromyces constitue un 
facteur limitant dans Texptoitation industrielle de ce 
systems d'expression. 

La Demanderesse a maintenant identifi6, don 6 et 
s6quenc6 une region du genome de Kluyveromyces 
lactis presentant une activite de promoteur transcrip- 
tionnel (voir figure 1). Plus pr6cis6ment. cette region 
correspond au promoteur du g6ne PGK de K. lactis . 
Cette region, ou des derives ou fragments de celle-ci, 
peut etre utilisee de mani^re tr^s performante pour la 
production de prot^ines recombinantes chez les levu- 
res du genre Kluyveromyces . 11 est entendu que cette 
sequence peut ^galement etre utilisee dans d'autres 
organismes botes. 

Par ailleurs. I'analyse de la region du genome de 
Kluyveromyces obtenue a penmis de mettre en evi- 
dence 2 phases de lecture dans les 2 orientations op- 
pos6es (voir figure 2). Cette observation indique que 
le brin comptementaire de la region presentee sur la 
figure 1 possede egalement une activite promotrice 
agissantdans t'autre orientation. 

Un objet de ta presente invention reside done 
dans une sequence d'ADN comprenant tout ou partie 
de la sequence presentee ^ la figure 1 ou de son brin 
comptementaire, ou d'un derive de celles-ci. et pos- " 
s6dant une activite de promoteur. 

Au sens de la presente invention, on entend par 
derive, toute sequence obtenue d partirde la sequen- 
ce donn6e dans la figure 1 par modifications structu- 
rales (mutations, deletions, substitutions, additions, 
fragmentations ... ) conservant une activite de promo- 
teur. En particulier, les mutations peuvent porter sur 
un ou ptusieurs nucleotides, et les additions et/ou 
substitutions peuvent porter sur des elements de re- 
gulation, ou des regions activatrices teltes que les 
"UAS". 

Lorsqu'un d6riv6 est r6alis6. son activite de pro- 
moteur transcriptionnel peut etre mise en evidence de 
plusieurs fa;;ons, et en particulier en plagant sous le 
contrdle de la sequence etudiee, un gene de resistan- 
ce ou un marqueur de complementation. Toute autre 
technique connue de I'homme de I'art peut bien evi- 
demment etre utilisee ^ cet effeL 

Un objet plus particulier de l'invention concerne 
une sequence d'ADN con-espondant ^ la region 
comprise entre les 2 phases ouvertes ORF PGK et 
ORF X. telle que presentee sur la figure 6. 

Un autre objet de {'invention concerne un ADN re- 
combinant comprenant une sequence d'ADN telle 
que definie ci-dessus. 

Cet ADN recombinant peut contenir par exemple 
la sequence promotrice presentee d ta figure 1 ou un 
derive de celle-ci, dans taquelle est insere un site de 
restriction, facilitant t'utitisation de cette sequence 
comme promoteur, "portable". 

Preferentiellement, cet ADN recombinant 
contient en outre un ou plusieurs genes de structure. 
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Encore plus pr6f6rentiellement. TADN recombi- 
nant contient 6galemenl des signaux permettant la 
secretion du produit d'expression du ou desdits genes 
de stojcture. 

Dans un mode de realisation particulier de Tln- 
vention, I'ADN recombinant fait partie d*un plasmide 
d'expression, qui peut etre d replication autonome ou 
integratif. 

En particulier, des vecteurs d replication autono- 
me peuvent etre obtenus en utilisant des sequences 
d replication autonomes (ARS) chez Thote choisi. No- 
tamment, chez la levure, il peut s*agir d'origines de re- 
plication derivees de plasmides connus (pKD1, 2^, 
etc). 

Les vecteurs integratifs peuvent etre obtenus no- 
tamment en utilisant des sequences homologues d 
certaines regions du g6nome de Thdte, permettant, 
par recombinaison homologue, Tintegration du vec- 
teur. 

La sequence presentee sur la figure 1 a ete ob- 
tenue par criblage d'une banque d'ADN genomique 
total de Kluyveromyces lactis au moyen d'une sonde 
heterologue provenantdu gene PGK de S. cerevisiae . 
La Demanderesse a en effet montre qu'it est possible 
de doner une region promotrice chez Kluyveromyces , 
par hybridation d partir de sondes heterologues 
correspondant d un gene de S. cerevisiae . Les details 
du donage de la sequence sont donnes dans les 
exemples. La region intergenique peut ensuite etre 
isoiee e partir de cette sequence, notamment par in- 
sertion de sites de restriction en utilisant la technique 
d'amplification par PGR comme indique dans les 
exemples. 

Un autre objetde I'invention concerne les cellules 
recombinees contenant une sequence d'ADN telle 
que definie ci-avant 

Avantageusement, les cellules sontchoisies par- 
mi les levures, et encore plus preferentiellement, par- 
mi les levures du genre Kluyveromyces . II est entendu 
cependant que I'invention couvre toute les cellules re- 
combinees dans lesquelies les regions promotrices 
de invention sont actives. 

Ces cellules peuvent etre obtenues par toute m6- 
thode permettant d'introduire un ADN etranger dans 
une cellule. II peut s'agir notamment de transforma- 
tion, etectroporation, ou toute autre technique connue 
de t'homme de Tart. 

Un autre objetde I'invention concerne Tutilisation 
d'une sequence telle que precedemment definie pour 
■'expression de genes recombines. 

Comme t'illustrent les exemples, les sequences 
d'ADN selon I'invention penmettent en effet une pro- 
duction e des nlveaux eieves de proteines recombi- 
nantes. 

Par ailleurs, I'activite promotrice bidirectionnelle 
des sequences de invention pennet une utilisation 
particulierementavantageuse, Notamment, il est pos- 
sible d'utiliser ces sequences dans les 2 orientations 



possibles, pour ['expression simultanee de ptusieurs 
genes de structure. 

Avantageusement, I'invention concerne I'utilisa- 
tion d'une sequence telle que precedemment definie 
5 pour I'expression simultanee, dans les 2 orientations 
opposees, de genes recombines. 

Avantageusement, les sequences de I'invention 
peuvent etre utOisees pour ['expression de genes co- 
dant pour des proteines d'interet pharmaceutique ou 
10 agroalimentaire. A titre d'exemple, on peut citer tes 
enzymes (tels que notamment la superoxide dismuta- 
se, la catalase, les amylases, les lipases, les amida- 
ses, la chymoslne etc.), les derives sanguins (tels que 
la semm-albumine, I'alpha- ou la beta-globine, le fac- 
ts teur VIII, le facteur IX, le facteur van Willebrand, la fh 
bronectine, Talpha-I antitrypsine etc.), Tinsutine et 
ses variants, les lymphokines (telles que les interteu- 
kines, les interferons, les facteurs de stimulation des 
colonies (G-CSF, GM-CSF, M-CSF...), leTNF, leTRF 
20 etc.), les facteurs de croissance (tels que rhonmone 
de croissance, I'erythropoietine, le FGF, TEGF, le 
PDGF, le TGF etc.), les apolipoproteines, des poly- 
peptides antigenlques pour la realisation de vacclns 
(hepatite, cytomegalovirus, Eppstein-Banr, herpes 
25 etc.), ou encore des fusions de polypeptides telles 
que notamment des fusions comportant une partie ac- 
tive fusionnee e une partie stabillsatrice (par exemple 
des fusions entre Taibumine ou des fragments d'albu- 
mine et le r6cepteur ou une partie d*un recepteur de 
30 virus (CD4, etc)). 

L'inventton sera plus compietement decrite e 
I'aide des exemples qui suivent, qui doivent etre 
consideres comme illustratifs et non limitatifs. 

35 LEGENDE DES FIGURES 

Figure 1 : Sequence nucieotidique de la region de 
2,2 kb du fragment chromosomique situe en 
annont du codon d'initiation de la traduction du 
40 gene PGK de K.lactis possedant I'activite promo- 

trice. 

Figure 2 : Analyse des phases ouvertes de lectu- 
re. Les demi-traits verticaux repr6sentent des co- 
dons d'initiation de la traduction. Les traits verti- 

45 caux entiers representent des codons stop. Les 

regions daires mettent en evidence les phase ou- 
vertes de lecture (ORF X et ORF PGK). 
Figure 3 : Carte de restriction du plasmide 
pYG610. La region noire correspond k la region 

50 isoiee du genome de K.lactis . 

Figure 4 : Strategie de sequen^age du fragment 
Xbal de 2,5 kb. 

Figure 5 : Sequence et localisation des oligo- 
deoxynudeotides utilises dans la reaction de 
55 PCR, pour I'insertion d'un site Hindi!! en -6 de 

I'ATG de la sequence de la figure 1. Les oligo- 
deoxynudeotides sont repr6sent6s en italique. 
L'ATG conrespond au codon d'initiation de la tra- 
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duction du g6ne PGK. 

Figure 6 : Sequence nucl6otidique de la region in- 
tergenique du fragment 2,2 kb. 6(a) : oligod§oxy- 
nucl^otides utilises dans la reaction de PCR. 
6(b) : Fragment Sal(l)- Hind lll correspondant aux 
nucleotides 1343 k 2246 sur la sequence de la fi- 
gure 1. 

Figure 7: Strategic de construction du plasmide 
pYG45. 

Figure 8 : Strat§gie de construction de cassettes 
d'expression de la s^runrvatbumine humaine. 
Figure 9 : Strat6gie de construction du plasmide 
pYG65. 

Figure 10 : Strat^gie de construction du plasmide 
pYG70. 

Figure 11 : Strat6gie de construction du plasmide 
pYG72. 

Figure 12 : Strat6gle de construction du vecteur 
PYG621. 

Figure 13 : Mise en 6vidence par "Northem blot" 
de Texpression du g^ne de I'albumine humaine 
sous la d^pendance du promoteur PGK de K.lac- 
tis. Les ^chantillons correspondents 10^g d*ARN 
total. 1 8S et 28S sont les positions des ARN ribo- 
somiques 18S et 28S. ALB = fragments reconnus 
par la sonde conrespondant au gdne de Talbumi- 
ne; URA = fragments reconnus par la sonde 
correspondant au g6ne URA A de K.lactis servant 
de t^moin de d^pot 

Figure 14 : Mise en Evidence de la production 
d'albumine dans les souches transfonm^es par le 
vecteur d'expression pYG621 contenant le pro- 
moteur PGK de K-lactis . Les 6chantillons corres- 
pondent S 30 ^] de sumageant de culture ; les 
bandes au niveau du marqueur 66 kd correspon- 
dent S I'albumine. M = marqueurs de masse mo- 
I6culaire : anhydrase carbonique bovine (31 Kd), 
ovalbumine (45Kd), BSA (66Kd), phosphorylase 
b de lapin (92kd). 

EXEMPLES 

1/ Isolement de la region promotrice du gene PGK 
de K lactis. 

La sequence pr6sent6e sur la figure 1 a 6t6 ob- 
tenue par criblage d'une banque d'ADN g6nomique 
total de Kluyveromyces lactis CBS2359 au nrroyen 
d'une sonde h6t6rologue provenant du g6ne PGK de 
S. cerevisiae (Dobson et al.. Nucleic Acid Res. 1982, 
10, 2625). Plus pr^cisement, la sonde utilis^e conres- 
pond au fragment N-tennriinal Pvu l- EcoR I de 1 ,3 kb du 
g6ne PGK de S. cerevisiae . 

En "Southern blof (Southern et aL. J.Biol.Chem., 
1975. 98. 503). la sonde utilisee s'hybride avec deux 
fragments drff§rents lorsque TADN g§nomique est di- 
g6r6 parXBai. L'un d'eux, de 2.5 kb environ, a 6t6 iso- 
16 par criblage d'une banque g^nomique restreinte de 



K. lactis CBS2359, constitute de fragments d'ADN 
coupes parXbal, d'une taille comprise entre 2 et 3 kb, 
introduits dans le plasmide pUC18 au site Xbal. Une 
banque de 500 dones a ainsi ete constitute, puis cri- 

5 bite avec la sonde htterologue dtcrite ci-dessus. 

Par hybridation sur colonies, un done a pu etre 
identifit et son ADN plasmidique a ttt prtpart. Ce 
plasmide (pYG610) contient un fragment d'ADN gt- 
nomique de 2,5 kb. dont la carte de restriction est prt- 

10 sentte k la figure 3. Le plasmide pYG61 1 contient le 
meme insert dans la direction opposte (voir figure 8). 

Dans une seconde ttape, le fragment de 2.5 kb 
ainsi isolt a ttt stquenct. en utilisant la mtthode de 
Sanger (Sanger et al., Proc.NatAcad.Sci 74. 1977, 

15 5463). Pour cela. le fragment issu de pYG611 a 
d'abord ttt sous-dont dans les bacteriophages 
M13tg1 30 et M13 Jgl 31 . La strattgie de stquenpage 
du fragment est schtmatiste sur la figure 4. 

L'anatyse de la sequence obtenue montre que le 

20 fragment isolt contient une partie codant pour la rt- 
gion N-temninale de la prottine Pgk de Kluyveromy- 
ces lactis (0.3 kb), et 2,2 kb conrespondant S la rtgion 
promotrice situte en amont du site d'initiation de la 
traduction. Elle montre de plus que. dans I'orientation 

25 opposte par rapport au gtne PGK . se situe une se- 
conde phase de lecture situte k environ 0,9 kb en 
amont de I'ATG du gtne PGK (figure 2). 

La comparaison de cette sequence avec celle du 
promoteur du g6ne PGK de S. cerevisiae fait apparai- 

30 tre I'absence d'homologie particulitre. notamment 
avec son element de regulation. Cette sequence 
correspond done k une region promotrice entitrement 
originale. trts distincte de celles dtjd decrites. sur le 
plan de sa structure, et par consequent sur le plan de 

35 sa regulation. 

2/ Construction de vecteurs d'expression pour la 
production de proteines htttrologues : 

40 Cet exemple illustre rutilisation des capacites 

promotrices de la sequence de 2,2 kb de la sequence 
de la figure 1 et de sequences dtrivees. 

a) Insertion d'un site de restriction en -6 de I'ATG. 

45 

L'insertion de ce site permet ensuite d'introduire 
en aval du promoteur obtenu toutgtne que Ton desire 
exprimer. Pour des raisons de compatibilite avec des 
vecteurs d'expression existant (EP 361 991), des pro- 
50 moteurs "portables" ont ete construits sous forme de 
fragments Sall- Hind lll. 

Un site Hindi II a ete introduit en position -6 par 
rapport au site d'initiation de la traduction (ATG) du 
gtne PGK en utilisant la technique d'amplification par 
55 PCR (Mullis et al.. Meth.Enzymol. 155. 1987. 335). 
Dans ce but. 2 oligodeoxynucieotides ont ete utilises, 
qui sont presentes sur la figure 5. 

L'oligodeoxynudeotide A con-espond k la se- 

4 
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quence situ§e d 467 pb en amont du codon ATG, au 
niveau d'un site Hind lll, qui sera ainsi remplac^ par un 
site Sa[l lors de 1' amplification. L'oligod^oxy nucleoti- 
de B correspond d la sequence en amont du site d'ini- 
tiation, et penmet d'introduire un site Hindl ll en posi- 5 
tion -6. 

Le fragment obtenu par PGR a §t§ ins6r6 entre 
les sites Sa[l et Hind lll du bacteriophage M13tg130 
afin de verifier pars^quen^age que des mutations ne 
sont pas apparues lors de ramplification. io 

b) Construction de cassettes d'expression de la 
serunrvalbumine humaine : figure 8. 

L'ADN recombinant de 474 pb obtenu ci-dessus is 
a ete introduit au niveau des sites Sa[l et Hind lll. dans 
le ptasmide pYG45 (figure 7) pour obtenir le vecteur 
pYG614 (figure 8). Le plasmide pYG45 contient une 
cassette d'expression constitute du promoteur et du 
terminateur du gfene PGK de S. cerevisiae entre les- 20 
quels, au niveau d'un site Hind lll, est insert le g§ne 
codant pour la prepro-serum-albumine humaine (se- 
quence pr6pro-HSA). pYG45 est d6riv6 de pYG18 
(voir brevet EP 361 991) par sous-clonage du frag- 
ment Sall - BamHI contenant la cassette d'expression 25 
HSA, dans les sites correspondants du vecteur pIC- 
20RDH (figure 7). plC-20RDH est obtenu par diges- 
tion du plasmide plC-20R (March et al., Gene 32. 
1984, 481) avec Tenzyme Hind lll, remplissage des 
extr6mit6s avec le fragment Klenow de la polymerase 30 
I d' E.coli et recircularisation avec la T4 DNA ligase. 

A partir du plasmide pYG614, le fragment Sal l- 
Sacl peut 6tre isoie par digestion. II contient : une re- 
gion promotrice derivee de la sequence de la figure 1 , 
le gene de Talbumine et le temiinateur du gene PGK 35 
de S. cerevisiae . II constitue une cassette d'expres- 
sion qui peut etre inseree dans un plasmide pour 
constituer un vecteur d'expression. 

Une autre cassette d'expression peut etre obte- 
nue d partir du plasmide pYG61 4, par clonage du frag- 40 
ment Afl Ill- Sac ! contenant une partie du promoteur 
PGK de I'invention, le gene de I'albumine (pr6pro- 
HSA) et le temiinateur PGK de S. cerevisiae dans le 
plasmide pYG611 decrit prealablement. Ceci genere 
le plasmide pYG815. Le fragment Sall- SacI conte- 45 
nant : la r^ion promotrice de la figure 1 entiere, le 
gene codant pour la prepro-serum-albumine. ette ter- 
minateur du gene PGK de S. cerevisiae, peut ensuite 
etre isoie par digestion. Ce fragment constitue une se- 
conde cassette d'expression de Talbumine utilisant la 50 
sequence promotrice de invention. 

c) Construction de vecteurs d'expression de 
Talbumine. 

55 

Des vecteurs d'expression de I'albumine peuvent 
etre construits par insertion des cassettes d'expres- 
sion obtenues ci-dessus dans des plasmides navet- 



tes K.lactrs/E.coli tels que pYG72 (figure 10). En par- 
ticulier, un vecteur d'expression a ete obtenu (vecteur 
pYG621) par insertion du fragment Sall-SacI de 
pYG615 contenant la cassette d'expression de Talbu- 
mine dans le vecteur pYG72 (voir figure 10). Ce vec- 
teur correspond au plasmide pKan 707 (voir EP 361 
991) dans lequel le fragment Sad contenant le gene 
URA3 a ete eiimine, ainsi que le site unique Hindlll 
present dans le gene aph pour faciliter les construc- 
tions ulterieures. Le gene aph code pour Taminogly- 
coside 3'- phosphotransferase (I) (Oka et al., J. Mol- 
Biol. 147 , 1981, 217) et est utilise comme marqueur 
de resistance au G418 chez la levure. Le fragment 
PstI du plasmide pKan707 contenant le gene aph a 
ete sous-done dans le bacteriophage M13mp7 pour 
donnerle vecteur pYG64 (figure 9). Le site Hind lll pre- 
sent dans ce gene a ete detruit par mutagenese din- 
gee selon la methode decrite par Taylor et al. (Nucleic 
Acid Res. 13, 1985, 8749). Le plasmide resultant a 6t6 
appeie pYG65 (figure 9). L'oligod6oxynucl6otide uti- 
lise pour la mutagenese avait la s^uence 5'-GAA 
ATG CAT AAG CTC TTG CCA TTC TCA CCG -3' et 
transfomnait le triplet CTT codant pour Tacide amine 
185 (Leu) en CTC. Ce changement ne nfK>difie pas la 
sequence proteique resultante. Pour construire le 
ptasmide pYG72, la partie contenant le replican bao- 
terien du vecteur pKan707 a ete isoiee par digestion 
avec I'enzyme EcoR I et recircularisation avec la T4 
DNA ligase pour obtenir pYG69. Le fragment PstI pre- 
sent dans ce dernier vecteur contenant le gene aph a 
ete remplace par le fragment equivalent mute prove- 
nant de pYG65. Cette construction a ete appeiee 
pYG70. La sequence de pKDI de4,7 kb comprise en- 
tre les sites EcoR I et SacI a 6t6 introduite dans ce der- 
Tiier vecteur pour obtenir pYG72. Le vecteur pYG621 
(figure 1 1 ) a ete obtenu par insertion du fragment Sal l- 
Sac I contenant la cassette d'expresston de I'albumine 
provenant de pYG615. 

3/ Construction d'une cassette permettant d'utiliser 
la region promotrice dans les 2 orientations . 

Cette construction a ete obtenu e par introduction 
d'un site Sa[l et d'un site Hind lll de part et d'autre de 
la region comprise entre les 2 phases ouvertes de lec- 
ture identifiees sur la figure 2: ORF PGK et ORF X, 
soit au niveau des nucleotides 1343 et 2246 sur la fh 
gure 1. 

Cette construction a ete realisee par la technique 
de PCR en utilisant d'une part Toligodeoxynudeotide 
A qui introduit un site Sa[l en position -1 par rapport 
au site d'initiation de la traduction du gene PGK, et 
d'autre part I'oligodeoxynudeotide B qui introduit un 
site Hind lll en position -1 par rapport au site d'initia- 
tion de la traduction du gene X (voir figure 6(a)). En- 
suite, pour eiiminer un site Hind lll present dans la re- 
gion promotrice, 3 reactions de PCR ont ete effec- 
tuees en utilisant e cheque etape le plasmide pYG61 0 
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comme matrice : 

- !es 2 premieres, pour amplifier les r6gions de 
part et d'autre du site Hindlll en utilisant les oligo- 
d6oxynuel6otides A et B couples respectivement 
aux oltgod§oxynucl6otides C et D (figure 6). Ces 5 
2 derniers sont compl^mentaires et permettent 
d'introduire une mutation ponctuelte au niveau du 

site Hind lll inteme ; 

- la derni^re, en utilisant les 2 produits d'amplifi- 
cation pr6c6dents comme amorce, pour g6n6rer io 
le fragment final contenant la region promotrice 
modifi^e. 

Cette region peut ensuite etre introduite dans les 
vecteurs d6crits dans Texempte 2, et utilis6e comme 
promoteur bidirectionnel, is 

4/ Expression d'albumine 

Le vecteur pYG621 a 6t6 introduit partransfonma- 
tion dans la souche K.lactis MW98-8C (CBS 579.88), 20 
en utflisant la technique ^thyl^ne glycol/dim^thylsul- 
foxyde (Dunrens etal., 1990, Curr. Genet 18. 7). Cette 
souche derive de la souche sauvage CBS2359 et pr6- 
sente le genotype : Mat_. uraA, LysA, argA, K+. cir. 
Les levures transfonm^es sont s^tectionn6es pour le 25 
ph6notype "041 8-resistant" que confers le plasmide 
pYG621 sur milieu YPD (extrait de levure 1 0 g/1, pep- 
tone 20 g/l, glucose 20 g/I) contenant de la g6n6ticine 
d 0,2 gyi. Des souches transfonm^es par le plasmide 
pYG72 ne contenant pas de cassette d'expression 30 
ont 6t6 s^lectionn^es pour servlr de t^moin dans les 
tests de production. Par ailleurs. afin de comparer I'ef- 
ficacit6 du promoteur PGK de K.lactis selon Tinven- 
tion par rapport d celui de S.cerevisiae , des souches 
transfonm6es par le vecteur pYGI 9 ont 6galement 6t6 35 
s^lectionn^es. Le vecteur pYG19 est analogue au 
vecteur pYG621, sauf que le gfene de Talbumine est 
sous le controle du promoteur PGK de S.cerevisiae 
(EP 361 991). 

40 

a) Analyse des ARNm : 

Les cellules sont cultiv^es d 28°C en milieu s^lec- 
tif YPD (extrait de levure 10 g/I, peptone 20 g/1. gluco- 
se 20 g/1) contenant de la g^n^ticine i 0.2 g/I. Les 45 
ARN totaux sont extraits (Shenman et al., Methods in 
Yeast Genetics, Cold Spring Harbor Laboratoty, 
1986. 143) et s^par6s par ^lectrophor^se sur gel 
d'agarose. Suivant la m^thode de "Northern blof 
(Maniatis et al.. 1 982 Molecular cloning. Cold Spring so 
Harbor, Laboratory Press), les ARN sont hybrid6s d 
une sonde con-espondant au g^ne de structure de Tal- 
bumine (fragment Hindl il- Hind lll de 1 .9 kb) provenant 
du vecteur pYG18 (figure 7). L'autoradiographie mon- 
tre clairement une bande de 2,3 kb sp^cifique de I'al- 55 
bumine (figure 13). Par ailleurs. il apparait clairement 
que le taux de transcription du g^ne de I'albumine est 
bien sup^rieur dans les souches contenant une re- 



gion promotrice de I'invention (pYG621), que dans 
celles contenant le promoteur PGK intact de S. cere- 
visiae (pYG19). 

b) Analyse des proteines : 

Les cellules sont cuttiv^es en erienmeyers dans 
un milieu selectif YPD (extrait de levure 10 g/1. pepto- 
ne 20 g/I, glucose 20 g/I) contenant de la g^n^ticine 
d 0.2 g/I d 28''C sous agitation. Apr^s 98 heures de 
culture, 30 ^l de sumageant sont pr^lev^s et m§lan- 
g^s S un volume Equivalent de tampon Laemmli 2X 
(Laemmli, 1970. Nature 227, 680). Apr§s chauffage ^ 
96**C pendant 10 minutes, les prot6inesde r6chantil- 
lon sont ensuite sEparees sur gel de polyacrylamide 
SDS 8.5 %. La production d'al bumine est ensuite r6- 
vElEe par coloration du gel au bleu decoomassie, puis 
est EvaluEe pour les diff^rents vecteurs utilises. La Th 
gure 14 montre que les 4 clones obtenus s6par6ment 
par transfomriation de la souche MW98-8C par le vec- 
teur pYG621 s6cr§tent beaucoup plus d'albumine 
que ceux obtenus par transfonmation avec le vecteur 
pYG19. 

II est dair que la r^ion pronratrice de invention 
penmet une excellente production d'al bumine par la 
levure, supErieure d celle obtenue avec le promoteur 
PGK de S.cerevisiae . Cette region, ou des fonmes r6- 
duites ou d6nv6es de celle-ci. constituent un outil in- 
dustriel important pour les syst^mes de production 
microbiotogiques, et plus particuli^rement eucaryo- 
tes. 



Revendications 

1 . Sequence d'ADN comprenant tout ou partie de la 
sequence presentee d la figure 1 ou de son brin 
complEmentaire, ou d'un d^rivE de celles-ci. et 
poss6dant une activity de promoteur transcrip- 
tionnel. 

2. Sequence d'ADN selon la revendication 1 
comprenant tout ou partie de la sequence pr^sen- 
t^e sur la figure 6(b). 

3. ADN recombinant comprenant une sequence 
d'ADN selon les revendications 1 ou 2. 

4. ADN recombinant selon la revendication 3 carac- 
t^risE en ce qu'il contient en outre un ou plusieurs 
g^nes de structure. 

5. ADN recombinant seton la revendication 4 carac- 
t^risE en ce qu'il contient Egalement des signaux 
penmettant la secretion du produit d'expression 
du ou desdits g^nes de structure. 

6. ADN recombinant selon I'une quelconque des re- 
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vendications 3^5 caract§ris6 en ce qu'ii fait par- 
tie d'un plasmide d'expression. qui peut etre k re- 
plication autonome ou int^gratif. 

7. Cellule recombin^e contenant une sequence 5 
d'ADN ou un ADN recombinant selon Tune quel- 
conque des revendications pr^c^dentes. 

8. Cellule reconnbin6e selon la revendication 7 ca- 
ract§ris6e en ce qu'il s*agit d'une levure. io 

9. Cellule recombin^e selon la revendication 8 ca- 
ract^ris^e en ce qu'ii s'agit d'une levure du genre 
Kluyveromyces. 

15 

10. Utilisation d'une sequence d'ADN selon Tune 
quelconque des revendications 1^6 pour I'ex- 
pression de g6nes recombin^s. 

11. Utilisation selon la revendication 10 pour I'ex- 20 
pression simultan6e. dans les 2 orientations op- 
pos^es, de g^nes recombin6s. 

12. Utilisation selon Tune des revendications 10 ou 

11 pour I'expression de g^nes codant pour des 25 
prot^ines d'int^rSt pharmaceutique ou agroali- 
mentaire. 

13. Proc^dd de preparation d'une prot^ine recombi- 
nante par expression de son g^ne dans un hdte 30 
cellulaire caract^rise en ce que I'expression dudit 
gdne est sous le contrdle d'une sequence selon 

la revendication 1. 

14. Proc^de selon la revendication 13 caracterise en 35 
ce que la proteine est la serum-albunnine humai- 

ne. 



40 



45 



50 



55 



EP0 511 912 A1 



10 20 30 . 40 50 60 

TCTAGATTTA GCGGGTCATC GAAATTTAGT AGCGAGTCTA TTAGGGACCA GAGTTGCAAC 

70 80 90 100 110 120 

CTGAGGTTTA ATGCGTCATC CTGTCGTTGC TrCAAGTTCC CCACTTGAAT CACTTGGACA 

130 140 150 160 170 180 

AACCGTTTCA TTGGTTTGAG GAAGGTGACG GATCTGGGTA GAAACTGGAC TACTGCATCT 

190 200 210 220 230 240 

GTTGGTAGTC TTGATGCCAT GGTGATGAGC CATTGCCATT GGAAAAGAGT GAATTCAGAT 

250 260 270 280 290 300 

TCCAAGATTT GGTCAATGAT TGATTTTGTA AGATTGAGAT CGTAATCCTG ATACTCTTTG 

310 320 330 340 350 360 

AGCCATGTTT CCAACAGTTC TTCGGAATCT GCCGGTGTGG AAACGAGTAT TTCGGAGTAC 

370 380 390 400 410 420 

AATCTCGGTG GTTGCGTTAT CTGAGAGGAT GGTGTAGTGG TTTGATGTTG CTGTGTGAAA 

430 440 450 460 470 480 

GATGATGCAG AGCTGATCAA CGATTCGAAC TGGGAGATCA CTTCGTTCAC TTCTTCCTGG 

490 500 510 520 530 540 

TTCCCGTTAC CTGTTTGCGT TTCCTCATAC ATTGGTACGC TATCCTCATC TTCAGATAAC 

550 560 570 580 590 600 

GAAATATCAA ACTCATCGGA ATCGGACGCG TCGTTCAAAT CGCCCTCATC CTTGGTAATG 

610 620 630 640 650 660 

TTCTTGAACC GGTCGAGAAG GTTGAGAATC TCTGTCGGAA CACCACCCTG CGGCGTATAC 

670 680 690 700 710 720 

CAGAACCAGA ATAAATTGTA GCACATCTTA ACTTTCTCTA AGGAAACATC TGAACTCTGA 

730 740 750 760 770 780 

TCAACGCATT CCGTAAGTAT ACTGTTTGCC TTGTCTCTGG TGAATTTATG AGGGTAAGAC 

790 800 810 820 830 840 

TCTGAGATCA TAAGTAACTG TTGAGCATCG AAGTTGTTGT AGTTTGAAAT TAGGGATCTG 

850 860 870 880 890 900 

GAAAGATGCG GTACCACTGC TTTGATGACA ITATCTGGCG GGTTCAACGG TACCAATTCC 

910 920 930 940 950 960 

TGCAAGAATA GCGAATCCAA CGGTTTTAAC TCAGAGTAAT GGTTGATCAA CTCGATGAAA 

970 980 990 1000 1010 1020 

ACGTCCCAAT GGATGGATTG CATCAAGTGT TGATGTTCCA CCAAATTAAG ACAATATTTC 

1030 . 1040 1050 1060 1070 1080 

GTAACGTTTT CGAGTGAAAC TGACACGGGC CTGCCCTCAG CACTCGTAGA CACGAGTAAC 

1090 1100 1110 1120 1130 1140 

GTCTTGAGAC CXCTCGTACA GGGAAGCGAC ATATCGTTCA ATAGACTATG GAACAAAGTG 

1150 1160 1170 1180 1190 1200 

TACACCGCAG CGATATCCTT GCATTTGCAA AACGATTGAA TAAGTGACGT CGATGCTAAA 

1210 1220 1230 1240 1250 1260 

TCCTGGATAA GTACGCTGGT ATCGTGTAAG CCCATGAGAA CGACACGTTC CTCATCACTA 



FIGURE 1 
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1270 1280 1290 1300 1310 1320 

GAAGCCGAAC TGTTGTCrTC AGTGGGGATT GGTTCGACAT rTTGCCAATT GCTGTCGATG 

1330 1340 1350 1360 1370 1380 

TACCCTTTCA AAGCCATGTA CCTTAAATCT TCATCCTTGG CAAGTAGATT CATCGGGTCT 

1390 1400 1410 1420 1430 1440 

GTTTGAAGTA AGAATATTTG CTTGTrXTTA TGGTATCAAA GGTATATGTT GTAGAAGACA 

1450 1460 1470 1480 1490 1500 

ATTTCCGGTA ATCCAATTGT CTGTCTGCrC AGTTTAGCAC ATGTATAGTA CGTTCCACAT 

1510 1520 1530 1540 1550 iSfio 

AGTCTACAAT ATTCAGCATT CAGCATTCAG TATACAGCAT ATGGCTAAAT GATCACAAAT 

1570 1580 1590 1600 1610 1620 

GTGATTGATG ATTTGACACG ACTAGAAAAG AGAACGAAAA AGGGAAATTC ATGTCACGTG 

1630 1640 1650 1660 1670 1680 

CGTTGGCACG TGACATG6AA TATCGAAGAA AGAAAAAAAA AAACGATCTC GTCCTAGTGG 

1690 17O0 1710 1720 1730 n^n 

AAGCCCAGAG TCTGGTCCCC CCGGAGTCTT CCCAAAACAA 6AAGCTGACA CATGTTGACA 

1750 1760 1770 1780 1790 iRon 

CAGAACACCC CACAGCAAAT GCACCACGCT ACGTAGATCA GGAAGCTTAA CTCTAGCGAC 

1810 1820 1830 1840 1850 ififin 

CTGTCGCTCG CCCCACAGAA CCTCACCCGA GAACCACACA TTACACGCCG CCAGCTCCCA 

1870 1880 1890 1900 1910 iq^n 

CTATACTCAT CTTGCTTCCC rTAAGCGTTC TCACGATTCG TTCGCTGCCC TTCTTCAAGA 

1940 1950 I960 1970 19B0 

GTCTTCTGAT TCTAATTCTC ATTCGAAATC CTCTACAGTT AATGAATTGC TTGACATGAC 

1990 2000 2010 2020 2030 2040 

ATTCATTGTC TCATGGTTTT GGCTTTTTGG CTTTTGTCTT TTAAAGCTAT ATCAACTTTA 

2050 2060 2070 2080 2090 2100 

C ATMRftftTfi Tft CGTCAAAA GGGGATTCAT TAATTAGAAA ATTCTCTTTT TCAATACTTG 

2110 2120 2130 2140 2150 21fiO 

CTATTCATTA TCAATCTATT CAACTCAATT GGTTATTATT TTCATCTTTT TGTCATCCTA 



2170 
AACCATCAAC 



2180 2190 2200 2210 2220 

^TCTGTT GCTACATTAA 6AGTTAC TTC RPj&a ATaara 



2230 2240 2250 

AAAAAATCGA TCAA6AATTA ATAAAAATG 

Met 



FIGURE 1 (suite) 
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FIGURE 2 
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FIGURE 3 
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FIGURE h 



Sail 

A 

5 'GGGAATTCGTCGA 

CTTAACTCTAGCGACCTGTC 3' 
3 ' TTCGAATTGAGATGGCTGGACAGGCAGCGGGGT 5 ' 



-4 67. 



Hindlll 



"3 



31 5« 

5 I CAAAAAAATCGATCAAGAATTAATAAAAATG 3 • 

3 ' GTTTTTTTAGCTAGTTCTTAATT 

TCGAACTTAAGGG 5' 

B 

Hindi 11 



FIGURE 5 
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Oligod^soxynucleotide A 
5 • CAT£Ii:£A£TTTTTATTAATTCTTGATCGAT3 ' 
Sail 

Oligod^soxynucl^otide B 

5 ' ATGMiaClXAAATCTTCATCCTTGGC3 ' 

Hindlll 
01igod§soxynucleotide C 

5 'GGGTGAGGTTCTGTGGGGCGAGCGACAGGTCGCTAGAGTTAAGCATCCTGATC3 ' 
(Position: 439 a 492) 

Oligod6soxynucl6otide D 

5 'GATCAGGAIGCTTAACTCTAGCGACCTGTCGCTCGCCCCACAGAACCTCACCCS ' 
(Position: 439 d 492) 



Hindlll 10 20 30 40 50 60 

^aamLTTAA ATCTTCATCC TTGGCAAGTA GATTCATCGG GTGTGTTTGA AGTAAGAATA 60 
ttcgaaAATT TAGAAGTAGG AACCGTTCAT CTAAGTAGCC CACACAAACT TCATTCTTAT 
TTTGCTTGTT TTTATGGTAT CAAAGGTATA TGTTGTAGAA GACAATTTCC GGTAATCCAA 120 
AAACGAACAA AAATACCATA GTTTCCATAT ACAACATCTT CTGTTAAAGG CCATTAGGTT 
TTGTCTGTCT GCTCAGTTTA GCACATGTAT AGTACGTTGC ACATAGTCTA CAATATTCAG 180 
AACAGACAGA CGAGTCAAAT CGTGTACATA TCATGCAACG TGTATCAGAT GTTATAAGTC 
CATTCAGCAT TCAGTATACA GCATATGGCT AAATGATCAC AAATGTGATT GATGATTTGA 240 
GTAAGTCGTA AGTCATATGT CGTATACCGA TTTACTAGTG TTTACACTAA CTACTAAACA 
CACGACTAGA AAAGAGAACG AAAAAGGGAA ATTC:ATGTCA CGTGCGTTGG CACGTGACAT 300 
GTGCTGATCT TTTCTCTTGC TTTTTCCCTT TAAGTACAGT GCACGCAACC GTGCACTGTA 
GGAATATCGA AGAAAGAAAA AAAAAAACGA TCTCGTCCTA GTGGAAGCCC AGAGTCTGGT 360 
CCTTATAGCT TCTTTCTTTT TTTTTTTGCT AGAGCAGGAT CACCTTCGGG TCTCAGACCA 
CCCCCCGGAG TCTTCCCAAA ACAAGAAGCT GACACATGTT GACACAGAAC ACCCCACAGC 4 20 
GGGGGGCCTC AGAAGGGTTT TGTTCTTCGA CTGTGTACAA CTGTGTCTTG TGGGGTGTCG 
AAATGCACCA CGCTACGTAG ATCAGG£^G£_I1AACTCTAG CGACCTGTCG CTCGCCCCAC 4 80 
TTTACGTGGT GCGATGCATC TAGTCCTACG AATTGAGATC GCTGGACAGC GAGCGGGGTG 
AGAACCTCAC CCGAGAACCA CACATTACAC GCCGCCAGCT CCCACTATAC TCATCTTGCT 54 0 
TCTTGGAGTG GGCTCTTGGT GTGTAATGTG CGGCGGTCGA GGGTGATATG AGTAGAACGA 
TCCCTTAAGC GTTCTCACGA TTCGTTCGCT GCCCTTCTTC AAGAGTCTTC TGATTCTAAT 600 
AGGGAATTCG CAAGAGTGCT AAGCAAGCGA CGGGAAGAAG TTCTCAGAAG ACTAAGATTA 
TCTCATTCGA AATCCTCTAC AGTTAATGAA TTGCTTGACA TGACATTCAT TGTCTCATGG 660 
AGAGTAAGCT TTAGGAGATG TCAATTACTT AACGAACTGT ACTGTAAGTA ACAGAGTACC 
TTTTGGCTTT TTGGCTTTTG TCTTTTAAAG CTATATCAAC TTTACATATA AATATACGTC 720 
AAAACCGAAA AACCGAAAAC AGAAAATTTC GATATAGTTG AAATGTATAT TTATATGCAG 
AAAAGGGGAT TCATTAATTA GAAAATTCTC TTTTTCAATA GTTGCTATTC ATTATCAATC 780 
TTTTCCCCTA AGTAATTAAT CTTTTAAGAG AAAAAGTTAT CAACGATAAG TAATAGTTAG 
TATTCAACTC AATTGGTTAT TATTTTCATC TTTTTGTCAT CCTAAACCAT CAACAATATT 840 
ATAAGTTGAG TTAACCAATA ATAAAAGTAG AAAAACAGTA GGATTTGGTA GTTGTTATAA 
TAAATATATC TGTTGCTACA TTAAGAGTTA CTTCAGAAAT AACAAAAAAA TCGATCAAGA 900 
ATTTATATAG ACAACGATGT AATTCTCAAT GAAGTCTTTA TTGTTTTTTT AGCTAGTTCT 
ATTAATAAAA Aatcaac q.- 
TAATTATTTT Tcagctg 

10 Sail 20 30 40 50 60 



FIGURE 6 
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Ndet 
BamHI 



Hindi! I / 
Sail/ 




term.POK S.c 
Hindlll 



prepro-HSA 



Hindlll 



prom. PGK S.C 



digestion Sall/BamHI 

isolation de la cassette d'expression 



Sail 



Hindlll 




Hindlll 
BamHI 



prom. PGK S.C term. PGK S.C 

prepro-HSA 




t 

digestion Sall/BamHI 



ligation 



|Ndel.Sacl 
BamHI 

bla^^P^^ .Hindlll 



Sad -7 
Sail/ 




prepro-HSA 



Hindlll 



prom. PGK S.c 



Figxire 7 
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digestion Afin/Sad 
ligation 

1 




prepro-HSA 
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